**2.10** Một chương trình chuẩn được chạy trên bộ xử lý 40 MHz. Chương trình được thực thi bao gồm   
100.000 lần thực thi lệnh, với hỗn hợp lệnh sau và số chu kỳ đồng hồ:

|  |  |  |
| --- | --- | --- |
| **Loại hướng dẫn** | **Đếm hướng dẫn** | **Chu kỳ trên mỗi hướng dẫn** |
| Số học số nguyên | 45.000 | 1 |
| Truyền dữ liệu | 32.000 | 2 |
| dấu phẩy động | 15.000 | 2 |
| chuyển điều khiển | 8000 | 2 |

Xác định CPI hiệu quả, tỷ lệ MIPS và thời gian thực hiện cho chương trình này.   
**2.11** Xét hai máy khác nhau, với hai tập lệnh khác nhau, cả hai đều   
có tốc độ xung nhịp là 200 MHz. Các phép đo sau đây được ghi lại trên hai máy chạy một bộ chương trình điểm chuẩn nhất định:

|  |  |  |
| --- | --- | --- |
| **Loại hướng dẫn** | **Số lệnh  (triệu)** | **Chu kỳ mỗi hướng dẫn** |
| Máy A  Số học và logicTải và lưu trữChi nhánhKhác | 8  424 | 1343 |
| Máy A  Số học và logicTải và lưu trữChi nhánhKhác | 10  824 | 1243 |

**một.** Xác định CPI hiệu quả, tỷ lệ MIPS và thời gian thực hiện cho từng máy.   
**b.** Nhận xét về kết quả.   
**2.12** Các ví dụ ban đầu về thiết kế CISC và RISC lần lượt là VAX 11/780 và IBM RS/6000   
. Sử dụng một chương trình điểm chuẩn điển hình, các đặc điểm của máy sau đây sẽ cho kết quả:

|  |  |  |  |
| --- | --- | --- | --- |
| **bộ vi xử lý** | **Tần số xung nhịp  (MHz)** | **Hiệu suất  (MIPS)** | **Thời gian CPU  (giây)** |
| VAX 11/780 | 5 | 1 | 12 *lần* |
| IBM RS/6000 | 25 | 18 | *x* |

Cột cuối cùng cho thấy VAX yêu cầu lâu hơn 12 lần so với thời gian IBM đo   
bằng CPU.   
**một.** Kích thước tương đối của số lệnh của mã máy cho   
chương trình điểm chuẩn này chạy trên hai máy là bao nhiêu?   
**b. Giá** trị *CPI* của hai máy là bao nhiêu

**2.13** Bốn chương trình benchmark được thực hiện trên ba máy tính với   
kết quả như sau:

|  |  |  |
| --- | --- | --- |
| **Máy tính A** | **Máy tính B** | **Máy tính C** |
| **chương trình 1** | 1 | 10 | 20 |
| **chương trình 2** | 1000 | 100 | 20 |
| **chương trình 3** | 500 | 1000 | 50 |
| **chương trình 4** | 100 | 800 | 100 |

Bảng hiển thị thời gian thực hiện tính bằng giây, với 100.000.000 lệnh được thực hiện trong mỗi chương trình trong số bốn chương trình. Tính toán các giá trị MIPS cho mỗi máy tính cho   
mỗi chương trình. Sau đó, tính trung bình cộng và trung bình điều hòa giả sử các trọng số bằng nhau cho bốn chương trình và xếp hạng các máy tính dựa trên trung bình cộng và trung bình điều hòa

**2.16** Xem xét ví dụ trong Phần 2.5 để tính toán CPI và tỷ lệ MIPS trung bình,   
kết quả là CPI = 2,24 và tỷ lệ MIPS = 178. Bây giờ, giả sử rằng   
chương trình có thể được thực thi trong tám tác vụ hoặc luồng song song với số lượng lệnh gần như bằng nhau thực hiện trong mỗi nhiệm vụ. Thực thi trên hệ thống 8 lõi với mỗi lõi (bộ xử lý) có cùng hiệu suất như bộ xử lý đơn được sử dụng ban đầu.   
Sự phối hợp và đồng bộ hóa giữa các bộ phận bổ sung thêm 25.000 lệnh   
thực thi cho mỗi tác vụ. Giả sử kết hợp hướng dẫn giống như trong ví dụ cho từng tác vụ, nhưng tăng CPI cho tham chiếu bộ nhớ với lỗi bộ nhớ cache lên 12 chu kỳ do tranh chấp bộ nhớ.   
**một.** Xác định CPI bình quân.   
**b.** Xác định tỷ lệ MIPS tương ứng.   
**c.** Tính hệ số tăng tốc.   
**d.** So sánh hệ số tăng tốc thực tế với hệ số tăng tốc lý thuyết được xác định bởi định luật Amdhal.

2.17 Một bộ xử lý truy cập bộ nhớ chính với thời gian truy cập trung bình là T 2 . Một bộ nhớ cache nhỏ hơn   
được đặt giữa bộ xử lý và bộ nhớ chính. Bộ đệm có   
thời gian truy cập nhanh hơn đáng kể T 1 < T 2 . Bộ đệm lưu trữ, bất cứ lúc nào, các bản sao của một số   
từ bộ nhớ chính và được thiết kế sao cho các từ có nhiều khả năng được truy cập   
trong tương lai gần nằm trong bộ đệm. Giả sử rằng xác suất mà từ   
tiếp theo được bộ xử lý truy cập nằm trong bộ đệm là H , được gọi là tỷ lệ trúng.   
một. Đối với bất kỳ quyền truy cập bộ nhớ đơn lẻ nào, tốc độ tăng tốc lý thuyết của việc truy cập   
từ trong bộ đệm thay vì trong bộ nhớ chính là gì?   
b. Gọi T là thời gian truy cập trung bình. Biểu diễn T dưới dạng hàm của T 1 , T 2 và H . Tăng tốc tổng thể như là một chức năng của H   
là gì?   
c. Trong thực tế, một hệ thống có thể được thiết kế sao cho trước tiên bộ xử lý phải truy cập vào   
bộ đệm để xác định xem từ đó có trong bộ đệm hay không và nếu không có thì hãy truy cập vào   
bộ nhớ chính, để khi bỏ lỡ (ngược lại với một cú đánh), thời gian truy cập bộ nhớ là T 1 + T 2 .   
Biểu diễn T dưới dạng hàm của T 1 , T 2 và H . Bây giờ hãy tính tốc độ tăng tốc và so sánh   
với kết quả được tạo ra trong phần (b).